iT邦幫忙

2024 iThome 鐵人賽

DAY 30
0
AI/ ML & Data

AI Unlocked: 30 Days to AI Brilliance系列 第 30

預測未知,無需重來:零樣本學習

  • 分享至 

  • xImage
  •  

想像有一個模型,即使沒看過某種動物,也能根據「毛茸茸、有大耳朵、長尾巴」推測它可能是隻小袋鼠。這就是 零樣本學習 (Zero-shot Learning, ZSL) 的神奇之處:即便面對沒見過的類別,模型仍能透過語義理解和推理,給出合理的預測。ZSL 的優勢在於它能處理 數據不足 或 新增類別 的場景,像是辨識罕見動物、診斷罕見疾病,甚至在客服系統中分類新產品。隨著 AI 的應用越來越多元,ZSL 成為突破性技術,讓模型可以不再受限於見過的世界。接下來,我們將深入探討 ZSL 如何透過語義嵌入、特徵匹配與生成模型,讓 AI 拓展未知的邊界。

一、數學原理與架構設計

ZSL 模型的核心在於學習輸入數據特徵空間語義空間的映射,並透過類別間的語意相似性進行推論。

  1. 映射函數設計

    • f : X → Z:將輸入資料(如圖像或文本)映射到特徵空間 ( Z )。
    • g : Y → Z:將類別的語義描述嵌入到同一特徵空間 ( Z )。
    • 預測時,模型會比較輸入數據的特徵向量f(x)與類別語義向量g(y)的相似度,並將資料標籤為最接近的類別。
  2. 語義嵌入 (Semantic Embedding) 技術細節

    • Word2Vec/GloVe:基於共現矩陣學習詞彙的嵌入,但對於複雜語境表現有限。
    • BERT / GPT 嵌入:能夠捕捉詞彙在多層語境中的語義,適合用於文本分類或對類別描述的理解。
    • 專用嵌入模型:根據應用場景(如醫學或生物學)訓練專屬的語義嵌入模型,提升語意推論能力。

二、技術分類:基於視覺與生成模型的差異

  1. 基於視覺特徵的匹配模型

    • 特徵提取模型:使用ResNet、VGGInception等卷積神經網路 (CNN) 將圖像轉換為特徵向量。
    • 相似度計算:計算輸入數據的特徵向量與類別語義嵌入之間的餘弦相似度。
    • 標籤預測:將輸入資料標記為與之語義最相近的類別。
  2. 基於生成模型的 ZSL(Generative ZSL)
    使用生成對抗網絡 (GAN)變分自編碼器(VAE),生成未見類別的合成特徵。

    • 訓練細節
      • GAN 的生成器負責合成新類別的樣本,鑑別器負責區分真實與合成特徵。
      • 將合成的樣本與語義描述進行匹配,進一步提升模型的泛化能力。

三、優化策略

  1. 標籤嵌入策略 (Label Embedding Strategies)
    使用**層次結構(hierarchical embeddings)屬性嵌入(attribute embeddings)**來捕捉類別之間的上下層級關係。
    例如:將動物分類為「哺乳類」和「鳥類」兩大層級,再在細分類中進行預測,提升預測精度。

  2. 自適應嵌入空間 (Adaptive Embedding Space)

    • 在推論過程中動態調整語義空間,使之更貼合輸入數據的分布。
    • 使用 元學習 (meta-learning) 技術優化嵌入空間,提升模型在新情境中的適應能力。
  3. 混合式 ZSL (Hybrid ZSL)

    • 結合 有監督學習ZSL 的方法,在有限標註數據與語義嵌入之間共享信息,提升模型表現。

四、應用範例與案例分析

  1. 圖像分類:稀有物種識別
    舉例:模型基於已知的動物語義描述,如「毛皮」、「尾巴」等特徵來預測新物種的類別。
    技術細節:使用 CNN 將圖像轉換為特徵向量,再與語義嵌入進行匹配。

  2. 醫療診斷:罕見疾病診斷輔助
    舉例:利用專用醫學嵌入模型和病症描述來預測罕見疾病。
    挑戰:必須解決醫學術語嵌入的多義性問題(如同一症狀在不同疾病間出現)。

  3. 自然語言處理:動態主題文本分類
    舉例:客服聊天機器人能根據新產品或服務的描述,自動適應新的對話分類。
    技術應用:使用 BERT 模型將輸入文本嵌入到語義空間,並動態匹配到新主題。

ZSL 將特徵提取與語義嵌入相結合,並透過匹配或生成技術解決預測挑戰。隨著技術的發展,這種創新方式不僅打破了既有的分類邊界,也為 AI 的未來應用帶來無限可能。想像一個未來,AI 無需學習每個新類別就能應對變化,這正是 ZSL 想要實現的目標。


上一篇
查詢得心應手:透視雜湊網絡的智慧之道
系列文
AI Unlocked: 30 Days to AI Brilliance30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言